Разработчики: | Content AI (Контент ИИ) |
Дата последнего релиза: | 2023/11/27 |
Технологии: | СЭД - Системы потокового распознавания |
Содержание |
ContentCapture (ранее FlexiCapture) – универсальная платформа для интеллектуальной обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы. C ContentCapture можно ускорить и упростить любые процессы, связанные с документооборотом.
ContentCapture оснащена инструментами, позволяющими гибко интегрировать процесс потокового ввода в текущую деятельность компании, что значительно упрощает обмен данными внутри организации.
Решения могут быть интегрированы с различными информационными системами, например, ECM, CRM, RPA, АБС и т.д.
2024: Совместимость ContentCapture 14 с Astra Linux Special Edition 1.7
Content AI и «Группа Астра» 25 апреля 2024 года объявили о совместимости своих продуктов: ContentCapture 14 и защищенной ОС Astra Linux Special Edition 1.7.
По результатам комплексного тестирования компании подписали сертификат, подтверждающий корректность совместной работы Astra Linux Special Edition и ContentCapture 14, кросс-платформенной версии решения для интеллектуальной обработки документов.
![]() | Сертификация ПО от Content AI станет значимой новостью для рынка, так как российские организации применяют автоматизированную обработку документов и данных не один десяток лет, и теперь вендор официально гарантирует корректность работы ContentCapture под Astra Linux. Это дает нашим клиентам уверенность, что можно успешно пользоваться технологиями, не зависящими от зарубежных разработчиков, и сохранить непрерывность бизнес-процессов. Мы очень рады тому, что коллеги из Content AI разделяют нашу позицию относительно необходимости обеспечивать полную совместимость продуктов, и уверены, что в результате дальнейшего сотрудничества конечным пользователям всегда будут доступны самые современные версии нашего софта, корректно работающие в рамках одной ИТ-инфраструктуры, — сказал Алексей Трубочев, директор департамента сопровождения «Группы Астра». | ![]() |
2023
Доступность на Linux в сетевом варианте использования
Компания Content AI 27 ноября 2023 года выпустила обновленную кросс-платформенную версию своего флагманского продукта ContentCapture 14.
В данном релизе платформа для извлечения данных и потоковой обработки информации из любых типов документов стала доступна на Linux в сетевом варианте использования, который позволяет задействовать мощности нескольких серверов для обработки большого количества документов. Сетевая установка предназначена для крупных проектов, где требуется обрабатывать десятки и сотни тысяч страниц ежедневно. Благодаря переходу на кросс-платформенный технологический стек продукт предоставляет одинаковую функциональность, вне зависимости от используемой ОС.
Также поддержан вариант гибридной инсталляции, когда в процессе импортозамещения на первом этапе на Linux мигрирует только серверная часть, а рабочие станции остаются на Windows. Это позволит осуществить миграцию максимально комфортно для пользователей.
![]() | В 2023 году фокус внимания команды Content AI сосредоточен на адаптации ключевых продуктов, в том числе ContentCapture для Linux, – уточнил технический директор компании Иван Волков. – В процессе реализации задачи мы ориентировались на лучшие практики по созданию кросс-платформенного ПО. Важно, чтобы наши решения сохраняли привычные пользователям свойства Windows-версий, и при этом были совместимы с отечественными операционными системами, такими как Astra Linux, ОС Альт и РЕД ОС. Серверная часть решения упакована в docker-контейнеры и готова к работе как на отдельных Linux-машинах, так и в составе docker-кластера. | ![]() |
Решение СontentCapture предназначено для компаний, которые в ежедневном режиме обрабатывают большие потоки входящей электронной и бумажной документации. Платформа позволяет автоматизировать обработку информации, извлеченной из отсканированных бумаг, фотографий, электронных документов. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы.
ContentCapture входит в реестр отечественного ПО и может заместить продукты западных вендоров – ABBYY FlexiCapture, Kofax Capture, IBM Datacap.
![]() | В основе продуктов Content AI лежат одни из лучших в мире технологий для интеллектуального распознавания данных и обработки естественного языка. Сегодня нам важно адаптировать их для нужд российских заказчиков, поэтому компания занимается выпуском решений для Linux и их совместимостью с отечественными операционными системами. Мы работаем в тесной связке с представителями различных секторов бизнеса и вместе находим оптимальные решения задач замещения иностранного софта, – пояснила Светлана Дергачева, генеральный директор Content AI. | ![]() |
В 2024 году Content AI также планирует выпустить ряд важных функциональных обновлений ContentCapture, связанных с повышением удобства использования продукта и упрощением основных операций.
Обновление с функцией распознавания русского рукописного текста
Функция распознавания русского рукописного текста появилась в обновленной версии платформы для интеллектуальной обработки информации ContentCapture. Обновленный релиз своего флагманского продукта 17 июля 2023 года представил российский разработчик ИИ-решений Content AI.
Как сообщалось, программа с обновленной функциональностью способна с оптимальной точностью распознавать в документах заполненные от руки поля на русском языке. Ранее ContentCapture могла распознавать только рукопечатный текст, где каждая буква прописывалась в отдельных полях заполняемой формы, например, анкеты или опроса. В данном релизе эти возможности объединены: система автоматически определяет, как написан текст, и распознает символы.
Важное технологическое изменение – способность распознавать курсив, то есть фразы, написанные без отрыва ручки от бумаги. Это одна из самых сложных задач, с которой ранее OCR-редакторы справлялись менее успешно. Кроме того, в выпуске существенно оптимизировано качество распознавания рукописного английского текста.
В ходе тестирования обновленной функциональности ContentCapture подтверждена точность распознавания данных в документах определенного типа в диапазоне 85-95%: речь идёт о паспортах и других документах, удостоверяющих личность, тестовых формах, служебных записках, подготовленных в свободном стиле.
![]() | Качество распознавания в рамках данной задачи сильно зависит от разборчивости почерка и вида документа. Во внутренних тестах мы ориентировались на лучшие образцы технологий, имеющиеся на российском рынке. По ряду сценариев распознавание русского рукописного текста в ContentCapture демонстрирует оптимальные показатели среди всех протестированных продуктов. Мы готовы индивидуально обучать и настраивать систему для более точной обработки конкретного, даже самого редкого, типа документа, если у заказчиков будет такая необходимость. уточнил Иван Волков, технический директор Content AI | ![]() |
![]() | Сценарии применения технологии распознавания рукописного текста востребованы в различных сферах, в которых ведется работа с документами, заполненными от руки, например в финансовых организациях и государственных структурах. Через специалистов этих ведомств ежедневно проходят десятки и сотни документов с элементами рукописного текста – паспортов, свидетельств, анкет, заявлений. Ввод данных в информационные системы зачастую осуществляется вручную. Автоматическая обработка и распознавание не только значительно оптимизирует скорость работы сотрудников, но и сократит количество ошибок, которые могут быть допущены при ручном переносе данных. отметила Светлана Дергачева, генеральный директор Content AI | ![]() |
В основе технологии распознавания русского рукописного текста лежат собственные разработки Content AI в области нейронных сетей. Современные методики впервые применены для реализации этой функциональности. В текущем релизе распознавание русского рукописного текста доступно в версии ContentCapture для Windows. До конца 2023 года планируется выпуск кросс-платформенной версии с возможностью использования на операционных системах на базе Linux.
В числе других обновлений релиза ContentCapture – редизайн интерфейса веб-станций. Он стал более легким и современным. При этом внутренняя структура продукта не претерпела значительных изменений, поэтому уже знакомые с платформой пользователи смогут приступить к работе без необходимости повторного обучения.
Включение в реестр российского ПО
Универсальная платформа для интеллектуальной обработки информации ContentCapture включена в реестр российского ПО под номером 17598. Об этом компания Content AI (Контент ИИ) сообщила 17 мая 2023 года.
ContentCapture — это российский аналог продукта ABBYY FlexiCapture, модифицированный специально для отечественного рынка с учетом потребностей российских пользователей. В основе платформы лежат технологии распознавания и интеллектуальной обработки документов. Решение позволяет ускорить и упростить любые процессы, связанные с документооборотом за счет высококачественного распознавания, классифицикации, извлечения данных из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений.
![]() | Бизнес нуждается в инструментах, позволяющих быстро и качественно обрабатывать информацию. Платформа ContentCapture способна стать ключевым элементом корпоративной инфраструктуры в организациях, которые управляют множеством бизнес-процессов и ежедневно принимают и генерируют большой поток данных, — отметила генеральный директор Content AI Светлана Дергачева. — Также ContentCapture идеально вписывается в стратегию цифровой трансформации. Собирая и анализируя информацию, платформа способствует ускорению транзакций, снижению затрат, повышению эффективности и оперативному принятию решений. | ![]() |
Включение ContentCapture в реестр отечественного ПО дает возможность различным ведомствам, компаниям из государственного сектора, образовательным учреждениям и архивам беспрепятственно использовать продукт в работе. С его помощью организации смогут в разы увеличить скорость и качество обработки информации, что в конечном итоге позволит быстрее реагировать на обращения граждан.
Content AI планирует развивать платформу ContentCapture, исходя из актуальных потребностей российского бизнеса. В следующих версиях предполагается расширение функциональности продукта для реализации новых пользовательских задач, которые постоянно возникают в процессе цифровой трансформации бизнеса и государственных структур. В числе приоритетных направлений – адаптация решения для упрощенной бесшовной интеграции с отечественным программным обеспечением на базе Linux.
Смена названия на ContentCapture
В январе-феврале 2023 года универсальная платформа для интеллектуальной обработки информации из любых типов документов FlexiCapture была переименована в ContentCapture.
Подрядчики-лидеры по количеству проектов
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)